智能论文笔记

MIPI 2022 Challenge on RGBW Sensor Re-mosaic: Dataset and Report

Qingyu Yang , Guang Yang , Jun Jiang , Chongyi Li , Ruicheng Feng , Shangchen Zhou , Wenxiu Sun , Qingpeng Zhu , Chen Change Loy , Jinwei Gu

分类：计算机视觉

2022-09-15

随着移动平台上对计算摄影和成像的需求不断增长，在相机系统中开发和集成了高级图像传感器与新型算法的发展。但是，缺乏用于研究的高质量数据以及从行业和学术界进行深入交流的难得的机会限制了移动智能摄影和成像（MIPI）的发展。为了弥合差距，我们介绍了第一个MIPI挑战，包括五个曲目，这些曲目着重于新型图像传感器和成像算法。在本文中，引入了RGBW关节Remosaic和Denoise，这是五个曲目之一，在全面分辨率上进行了RGBW CFA插值的插值。为参与者提供了一个新的数据集，其中包括70（培训）和15个（验证）高质量RGBW和拜耳对的场景。此外，对于每个场景，在0dB，24dB和42dB上提供了不同噪声水平的RGBW。所有数据均在室外和室内条件下使用RGBW传感器捕获。最终结果是使用PSNR，SSIM，LPIPS和KLD在内的客观指标评估的。本文提供了此挑战中所有模型的详细描述。有关此挑战的更多详细信息以及数据集的链接，请访问https://github.com/mipi-challenge/mipi2022。

translated by 谷歌翻译

MIPI 2022 Challenge on RGBW Sensor Fusion: Dataset and Report

Qingyu Yang , Guang Yang , Jun Jiang , Chongyi Li , Ruicheng Feng , Shangchen Zhou , Wenxiu Sun , Qingpeng Zhu , Chen Change Loy , Jinwei Gu

分类：计算机视觉

2022-09-15

随着移动平台上对计算摄影和成像的需求不断增长，在相机系统中开发和集成了高级图像传感器与新型算法的发展。但是，缺乏用于研究的高质量数据以及从行业和学术界进行深入交流的难得的机会限制了移动智能摄影和成像（MIPI）的发展。为了弥合差距，我们引入了第一个MIPI挑战，其中包括五个专注于新型图像传感器和成像算法的曲目。在本文中，引入了RGBW关节融合和Denoise，这是五个曲目之一，其中一条致力于将Binning模式RGBW融合到拜耳。为参与者提供了一个新的数据集，其中包括70（培训）和15个（验证）高质量RGBW和拜耳对的场景。此外，对于每个场景，在24dB和42dB处提供不同噪声水平的RGBW。所有数据均在室外和室内条件下使用RGBW传感器捕获。最终结果使用客观指标，包括PSNR，SSIM}，LPIPS和KLD评估。本文提供了此挑战中所有模型的详细描述。有关此挑战的更多详细信息以及数据集的链接，请访问https://github.com/mipi-challenge/mipi2022。

translated by 谷歌翻译

MIPI 2022 Challenge on Quad-Bayer Re-mosaic: Dataset and Report

Qingyu Yang , Guang Yang , Jun Jiang , Chongyi Li , Ruicheng Feng , Shangchen Zhou , Wenxiu Sun , Qingpeng Zhu , Chen Change Loy , Jinwei Gu

分类：计算机视觉

2022-09-15

随着移动平台上对计算摄影和成像的需求不断增长，在相机系统中开发和集成了高级图像传感器与新型算法的发展。但是，缺乏用于研究的高质量数据以及从行业和学术界进行深入交流的难得的机会限制了移动智能摄影和成像（MIPI）的发展。为了弥合差距，我们引入了第一个MIPI挑战，其中包括五个专注于新型图像传感器和成像算法的曲目。在本文中，引入了QUAD Remosaic和Denoise，这是五个曲目之一，在完全分辨率上进行了四QFA插值向拜耳进行插值。为参与者提供了一个新的数据集，包括70（培训）和15个（验证）高品质四边形和拜耳对的场景。此外，对于每个场景，在0dB，24dB和42dB上提供了不同噪声水平的四边形。所有数据均在室外和室内条件下使用四边形传感器捕获。最终结果使用客观指标，包括PSNR，SSIM，LPIPS和KLD。本文提供了此挑战中所有模型的详细描述。有关此挑战的更多详细信息以及数据集的链接，请访问https://github.com/mipi-challenge/mipi2022。

translated by 谷歌翻译

MIPI 2022 Challenge on RGB+ToF Depth Completion: Dataset and Report

Wenxiu Sun , Qingpeng Zhu , Chongyi Li , Ruicheng Feng , Shangchen Zhou , Jun Jiang , Qingyu Yang , Chen Change Loy , Jinwei Gu

分类：计算机视觉

2022-09-15

随着对移动平台上对计算摄影和成像的需求不断增长，在相机系统中开发和集成了高级图像传感器与相机系统中新型算法。但是，缺乏用于研究的高质量数据以及从行业和学术界进行深入交流的难得的机会限制了移动智能摄影和成像（MIPI）的发展。为了弥合差距，我们介绍了第一个MIPI挑战，包括五个曲目，这些曲目着重于新型图像传感器和成像算法。在本文中，引入了RGB+TOF深度完成，这是五个曲目之一，其中一条介绍了RGB传感器和TOF传感器（带有点照明）的融合。为参与者提供了一个名为TetrasRGBD的新数据集，其中包含18k对高质量合成RGB+DEPTH训练数据和2.3k对来自混合源的测试数据。所有数据均在室内场景中收集。我们要求所有方法的运行时间都应在桌面GPU上实时。最终结果是使用客观指标和平均意见评分（MOS）主观评估的。本文提供了此挑战中所有模型的详细描述。有关此挑战的更多详细信息以及数据集的链接，请访问https://github.com/mipi-challenge/mipi2022。

translated by 谷歌翻译

MIPI 2022 Challenge on Under-Display Camera Image Restoration: Methods and Results

Ruicheng Feng , Chongyi Li , Shangchen Zhou , Wenxiu Sun , Qingpeng Zhu , Jun Jiang , Qingyu Yang , Chen Change Loy , Jinwei Gu

分类：计算机视觉

2022-09-15

随着移动平台上对计算摄影和成像的需求不断增长，在相机系统中开发和集成了高级图像传感器与新型算法的发展。但是，缺乏用于研究的高质量数据以及从行业和学术界进行深入交流的难得的机会限制了移动智能摄影和成像（MIPI）的发展。为了弥合差距，我们介绍了第一个MIPI挑战，包括五个曲目，这些曲目着重于新型图像传感器和成像算法。在本文中，我们总结并审查了MIPI 2022上的分配摄像头（UDC）图像恢复轨道。总共，成功注册了167名参与者，并在最终测试阶段提交了19个团队。在这项挑战中开发的解决方案在播放摄像头映像修复局上实现了最新的性能。本文提供了此挑战中所有模型的详细描述。有关此挑战的更多详细信息以及数据集的链接，请访问https://github.com/mipi-challenge/mipi2022。

translated by 谷歌翻译

CuDi: Curve Distillation for Efficient and Controllable Exposure Adjustment

Chongyi Li , Chunle Guo , Ruicheng Feng , Shangchen Zhou , Chen Change Loy

分类：计算机视觉

2022-07-28

我们提出曲线蒸馏，CUDI，以进行有效且可控的暴露调整，而无需在训练过程中配对或未配对的数据。我们的方法从有效的低光图像增强方法零DCE继承了零引用学习和基于曲线的框架，并以其推理速度进一步提高了其推理速度，减少其模型大小以及扩展到可控的暴露调整。通过新颖的曲线蒸馏实现了改进的推理速度和轻量级模型，该曲线蒸馏通过高阶曲线的切线线近似于常规曲线框架中耗时的迭代操作。通过新的自我监督的空间暴露控制损失，可控制的暴露调整成为可能，该损失限制了输出的不同空间区域的暴露水平，即接近接触映射的亮度分布，以作为输入条件。与大多数只能纠正不渗透或过度曝光的照片的方法不同，我们的方法可以使用单个模型纠正未充分曝光和过度曝光的照片。值得注意的是，我们的方法还可以在输入条件曝光图的指导下在全球或本地调整照片的曝光水平，该图可以在推理阶段进行预定或手动设置。通过广泛的实验，我们表明我们的方法在真实场景中的快速，稳健性和灵活的性能吸引了最先进的方法。项目页面：https：//li-chongyi.github.io/cudi_files/。

translated by 谷歌翻译

Towards Robust Blind Face Restoration with Codebook Lookup Transformer

Shangchen Zhou , Kelvin C. K. Chan , Chongyi Li , Chen Change Loy

分类：计算机视觉

2022-06-22

盲面修复是一个高度不良的问题，通常需要辅助指导至1）改进从退化输入到所需输出的映射，或2）补充输入中丢失的高质量细节。在本文中，我们证明了在一个较小的代理空间中的一本学识渊博的代码书在很大程度上降低了恢复映射的不确定性和模棱两可，通过将盲面修复作为代码预测任务，同时为产生高质量的面孔提供丰富的视觉原子。在此范式下，我们提出了一个基于变压器的预测网络，名为CodeFormer，以模拟代码预测的低质量面孔的全局构图和上下文，从而使发现自然面，即使输入严重，也紧密近似目标面退化。为了增强不同降解的适应性，我们还提出了一个可控的特征转换模块，该模块可以在忠诚度和质量之间进行灵活的权衡。得益于表达的代码书的先验和全球建模，CodeFormer的质量和忠诚度都优于艺术状态，从而表现出优势的降级性。关于合成和现实世界数据集的广泛实验结果验证了我们方法的有效性。

translated by 谷歌翻译

On the Generalization of BasicVSR++ to Video Deblurring and Denoising

Kelvin C. K. Chan , Shangchen Zhou , Xiangyu Xu , Chen Change Loy

分类：计算机视觉

2022-04-11

长期信息的开发一直是视频恢复的一个长期问题。最近的BASICVSR和BASICVSR ++通过长期传播和有效的对齐方式在视频超分辨率方面表现出色。他们的成功导致了一个问题，即是否可以将它们转移到不同的视频修复任务中。在这项工作中，我们将BASICVSR ++扩展到用于视频恢复任务的通用框架。在输入和输出具有相同空间尺寸的任务中，输入分辨率通过稳定的卷积以维持效率而降低。只有从BASICVSR ++进行的最小变化，所提出的框架在各种视频恢复任务中都具有出色的效率，包括视频Deblurring和DeNoising。值得注意的是，BASICVSR ++的性能与基于变压器的方法相当，最多占参数降低和44倍加速的79％。有希望的结果表明，不仅仅是视频超级分辨率，在视频恢复任务中传播和对齐的重要性。代码和型号可在https://github.com/ckkelvinchan/basicvsr_plusplus上找到。

translated by 谷歌翻译

LEDNet: Joint Low-light Enhancement and Deblurring in the Dark

Shangchen Zhou , Chongyi Li , Chen Change Loy

分类：计算机视觉

2022-02-07

夜间摄影通常由于昏暗的环境和长期使用而遭受弱光和模糊问题。尽管现有的光增强和脱毛方法可以单独解决每个问题，但一系列此类方法不能和谐地适应可见性和纹理的共同降解。训练端到端网络也是不可行的，因为没有配对数据可以表征低光和模糊的共存。我们通过引入新的数据合成管道来解决该问题，该管道对现实的低光模糊降解进行建模。使用管道，我们介绍了第一个用于关节低光增强和去皮的大型数据集。数据集，LOL-BLUR，包含12,000个低Blur/正常出现的对，在不同的情况下具有不同的黑暗和运动模糊。我们进一步提出了一个名为LEDNET的有效网络，以执行关节弱光增强和脱毛。我们的网络是独一无二的，因为它是专门设计的，目的是考虑两个相互连接的任务之间的协同作用。拟议的数据集和网络都为这项具有挑战性的联合任务奠定了基础。广泛的实验证明了我们方法对合成和现实数据集的有效性。

translated by 谷歌翻译

Investigating Tradeoffs in Real-World Video Super-Resolution

Kelvin C. K. Chan , Shangchen Zhou , Xiangyu Xu , Chen Change Loy

分类：计算机视觉

2021-11-24

现实世界视频超分辨率（VSR）降解的多样性和复杂性构成了推理和培训中的非琐碎挑战。首先，虽然长期繁殖导致在轻度降解的情况下提高性能，但通过传播可以夸大严重的野外降解，损害输出质量。为了平衡细节合成和工件抑制之间的权衡，我们发现在传播之前减少噪声和伪像的图像预清洁阶段。我们的RealBasicVSR配备了精心设计的清洁模块，以质量和效率为现有的现有方法。其次，现实世界的VSR模型通常受到多样化的培训，以提高普遍性，需要增加批量尺寸以产生稳定的梯度。不可避免地，增加的计算负担导致各种问题，包括1）速度 - 性能权衡和2）批量长期权衡。为了缓解第一个权衡，我们提出了一种随机退化计划，可在不牺牲性能的情况下减少高达40％的培训时间。然后，我们分析了不同的训练环境，并建议在训练期间使用更长的序列而不是较大的批次，允许更有效的时间信息使用，导致推论期间的性能更稳定。为了便于公平的比较，我们提出了新的Videolq数据集，其中包含含有丰富纹理和模式的大量现实较低的视频序列。我们的数据集可以作为基准测试的共同点。代码，模型和数据集将公开可用。

translated by 谷歌翻译